iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 23
0

這一節將會介紹cloud speed api。這個api的最基本功能就是你可以上傳一段聲音檔案到server,然後server將會回傳給你這段聲音的文字檔給你。她也提供一個功能叫做speech timestamp,這個功能會告訴你這段聲音當中每個文字的斷點,這讓你更容易做搜尋。cloud speed api也有提供一個叫做batch & streaming transcription功能,這個功能可以讓你分段傳輸你的聲音並分段回傳,就是streaming啦。這邊提供了一個例子,這是一部GCP的教學影片,我們使用cloud speed api來幫助我們上字幕。使用speech timestamp的功能,可以讓我們輕易找到影片中有提到我們想找的關鍵字的地方,如果這部影片只有提到這個字一次,那用人工找將會很費工且很容易忽略掉。


上一篇
Day 22. Video intelligence API
下一篇
Day 24. Translation and NL
系列文
Google machine learning cloud 實戰30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言